Contribución de la información semántica en un sistema de aprendizaje automático para resolver la implicación textual

نویسندگان

  • Sonia Vázquez
  • Zornitsa Kozareva
  • Andrés Montoyo
چکیده

The variability of semantic expression is a special characteristic of natural language. This variability is challenging for many natural language processing applications that try to infer the same meaning from different text variants. In order to treat this problem a generic task has been proposed: Textual Entailment Recognition. In this paper, we present a new Textual Entailment approach based on Latent Semantic Indexing (LSI) and the cosine measure. This proposed approach extracts semantic knowledge from different corpora and resources. Our main purpose is to study how the acquired information can be combined with an already developed and tested Machine Learning system. The carried out experiments show that the combination of MLEnt, LSI and cosine measure improves the results of the initial approach.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Un Algoritmo Genético para Aprendizaje de un Sistema Basado en Reglas Difusas tipo Takagi Sugeno

Resumen— Este trabajo presenta un método de aprendizaje de la base de conocimiento de un Sistema Basado en Reglas Difusas tipo Takagi Sugeno mediante ejemplos. Para el aprendizaje de las particiones difusas utilizadas en los antecedentes se utiliza un Algoritmo Genético que incluye tanto el número de etiquetas de cada partición como la semántica de dichas etiquetas. Para el aprendizaje de las r...

متن کامل

Simplificación automática de textos en euskera

En este art́ıculo presentamos el trabajo llevado a cabo dentro del proyecto de tesis doctoral llamado “Egitura sintaktiko konplexuen identifikazioa eta sinplifikazioa euskararen tratamendu automatikoan” (Identificación y simplificación de las estructuras sintácticas complejas en el procesamiento automático del Euskera) que se realiza bajo la dirección de las doctoras Arantza Dı́az de Ilarraza y M...

متن کامل

Extracción de contextos definitorios en textos de especialidad a partir del reconocimiento de patrones lingüísticos

La extracción automática de definiciones a partir de textos de especialidad es una tarea cada vez más demandante para diferentes aplicaciones del Procesamiento de Lenguaje Natural, tales como lexicografía computacional, extracción de información, semántica computacional, sistemas preguntarespuesta, minería de textos, Web semántica y aprendizaje automático. Este artículo presenta un panorama de ...

متن کامل

Prólogo. Artículos seleccionados de IEEE ICALT 2008

Learning Technologies (IEEE ICALT), que está patrocinada por la sociedad IEEE y, en concreto, por el Comité Técnico sobre Tecnologías para la Educación (IEEE TCLT), es una de las más prestigiosas en su dominio. En el verano de 2008, la Universidad Carlos III de Madrid organizó su octava edición en Santander (España) siendo un éxito tanto en el número de ponencias recibidas para ser evaluadas co...

متن کامل

Análisis de sentimientos multilingüe en la Web 2.0

Nuestra propuesta consiste en un sistema de análisis de sentimientos h́ıbrido, que consiste una aproximación h́ıbrida, ya que utiliza un léxico de palabras etiquetadas según su polaridad, además de aprendizaje automático. El léxico se genera de manera automática a partir de un corpus etiquetado, y se asigna a cada término del texto una puntuación para cada polaridad. El aprendizaje automático se ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 37  شماره 

صفحات  -

تاریخ انتشار 2006